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摘要 : 
[目的 ] 人 类 能 够 快速 提取 集合 中 的 统计 信息 ， 形 成 平均 表征 。 对 于 平均 表征 的 产生 机 第 
究 者 提出 整合 集合 成 员 以 合成 平均 刺激 , 或 计算 集合 成 员 特征 值 的 平均 值 两 种 观点 。 以 往 
研究 中 合成 的 平均 刺激 的 特征 值 和 计算 成 员 特 征 值 的 平均 值 两 种 方式 的 结果 相似 , 难以 区 分 
两 种 观点 。 由 于 多 个 面孔 的 吸引 力 评 分 的 均值 与 用 这 些 面孔 合成 的 平均 面孔 的 吸引 力 评 分 存 
在 差异 , 本 研究 试图 利用 平均 面孔 吸引 力 的 特性 为 平均 表征 的 产生 来 源 于 合成 平均 刺激 的 观 
点 提供 了 支持 证 据 。 
[方法 ] 利用 多 个 面孔 的 吸引 力 平均 值 和 合成 平均 面孔 刺激 的 吸引 力 的 差异 ， 本 研究 使 用 经 
典 的 平均 辨别 任务 (实验 1 和 2) 和 直接 的 吸引 力 评价 任务 〈 实 验 3 和 4) 为 合成 平均 刺激 
的 机 制 提 供 了 支持 证 据 。 四 个 实验 分 别 采 用 大 容量 面孔 集合 和 小 容量 面孔 集合 探讨 平均 表征 
的 形成 ， 

[结果 ] 大 、 小 集合 都 形成 了 平均 刺激 ， 并 且 和 平均 表征 的 评定 和 加 工 结果 与 合成 的 平均 刺激 
条 件 更 接近 ; 此 外 ， 集 合 吸 引力 出 现 了 高 评 现象 ， 但 小 集合 高 评 现象 更 少 出 现 。 

[结论 ] 平均 表征 的 产生 可 能 来 源 于 合成 平均 刺激 的 参与 ， 而 非 简单 的 成 员 平 均值 计算 ; 但 
平均 刺激 的 作用 受到 集合 大 小 的 影响 。 
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Abstract: 

[Objective] Previous research demonstrated that ensemble perception of groups can 
be formed rapidly by extraction of the average of high-level complex features 
However, it is unclear whether the average percept is the outcome of extraction from 
the characteristic value of the average stimulus (for example, average face) created 
from group members, or from calculation of the average value of group members’ 
characteristic values. The above two values were confused with each other in prior 


research, since most average value of group members are similar as the characteristic 
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value of the average stimulus. However, the attractiveness rating of the average 
face created from a group of faces is usually systematically higher than the mean 
value of attractiveness ratings of this group of faces. Therefore, it is easier to 
explore how the ensemble coding of crowd face attractiveness (i.e. group 
attractiveness) is formed by comparing the attractiveness of the average face with 
the mean value of attractiveness rating of a group of faces. This could provide a 
useful approach to explore how the average percept is formed 

[Methods] The present study used the average discrimination paradigm (Experiment 
] & 2) and the scoring paradigm (Experiment 3 & 4) to clarify the mechanism of the 
formation of average percept by comparing the group attractiveness with the 
attractiveness of average face. To tackle this issue, whether the average face was 
presented in the group of faces or not was manipulated (conditions: Avg vs. NoAvg). 
Group size were also manipulated to explore whether group size modulated the 
formation of average percept. In the average discrimination paradigm, a group of 
faces served as group stimuli to be compare with the probe face for attractiveness. 
Participants were asked to judge which is more attractive between the group stimuli 
and the probe face. In the scoring paradigm, participants were asked to rate the 
attractiveness of group stimuli, the average face created from the group, and each 
face of the group in isolated manner. Each group consisted of twelve (in Experiments 
1 and 3) or four faces (in Experiments 2 and 4). There were two kinds of groups: 
one is that all group members are original faces, without the average face. The other 
is that an average face morphed from other original faces was included in the group. 

[Results] In Experiment 1, the proportions for judging probe average face more 
attractive than group attractiveness in the Avg condition was similar with the NoAvg 
condition. In Experiment 2, when the set size was four, the proportions for judging 
probe average face more attractive than group attractiveness were significantly 
higher in the NoAvg condition. Moreover, in Experiment 3, the ratings for group 
attractiveness were not significantly different between Avg and NoAvg conditions. 
This may indicate that the group attractiveness is based on the average face which 
was created from group members rather than the mean value calculated from group 
members' attractiveness. In addition, the diffusion model analysis showed that the 
coding time was longer for NoAvg condition, which indicated that the formation of 
average face needed cognitive resource. In Experiment 4, when the set size was four, 
the attractiveness rating of the average face was significantly higher than group 
ratings for the two kinds of groups. The different results in different group size 
may be interpreted as the outcome of weakened average percept caused by the salient 
individual face representations in small group. This was evident from several 
analyses: 1) group attractiveness and the attractiveness of morphed average face 
decreased with smaller set size (Experiment 4); 2) When the probe face was morphed 
average face, the proportion for judging probe face as more attractive than group 
attractiveness was greater, comparing with the condition when the probe was a new 
face whose attractiveness was similar with the morphed average face (Experiment 2) ; 
3) The performance for the hypothesized condition with average percept included in 


the set is in between the conditions with/without real average face included 


(Experiment 2-4). In addition, comparing with Experiment 1，the information 
accumulation speed in Experiment 2 is slower, the processing time of group 
attractiveness is longer, reflecting the disturbance of the individual face 
representation. 

[Conclusions] Group attractiveness is based on the morphed average face, and the 
ensemble percept relies on the extraction from the average stimulus created from 
the group. 
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1 引言 

我 们 的 视觉 系统 每 时 每 刻 接收 到 海量 信息 ， 这 些 信息 很 多 是 高 度 结 构 化 的 。 
这 些 结构 化 的 信息 彼此 相似 ， 以 集合 的 形式 存在 。 人 们 可 以 对 这 些 集合 进行 知觉 
平均 (perceptual averaging)， 相 当 精 确 地 抽取 集合 内 所 有 成 员 的 平均 表征 (average 
representation, Alvarez, 2011; Haberman & Whitney, 2012; Whitney & Yamanashi 
Leib，2018), 涉及 大 小 、 方 向 、 明 度 、 位 置 等 低 水 平 特征 (Alvarez & Oliva, 2008; 
Ariely，2001; Bauer, 2009; Parkes et al.，2001)， 也 包括 面孔 身份 、 性 别 和 表情 


等 高 级 社会 性 信息 (Haberman & Whitney, 2007; Haberman et al., 2015; Li et al., 

2016)。 很 多 研究 关注 大 脑 中 平均 表征 是 如 何 产生 的 : 是 通过 整合 集合 成 员 来 形 
成 一 个 平均 刺激 的 表征 还 是 通过 个 体 成 员 特征 的 平均 值 (mean value) 计 算 来 完成 
平均 任务 (Maule & Franklin，2015; Whitney & Yamanashi Leib，2018)。 以 往 研 究 
H, 平均 表征 通常 是 用 集合 成 员 的 平均 值 来 作为 测量 指标 , 隐 含 了 平均 表征 等 同 
于 集合 成 员 平均 值 的 假设 。 然 而 ,由 于 集合 平均 刺激 的 特征 值 和 成 员 特 征 值 的 平 
均 往 往 十 分 相似 而 难以 区 分 , 这 种 假设 并 不 能 作为 证 据 来 区 分 平均 表征 的 产生 是 
由 于 大 脑 中 形成 平均 刺激 的 表征 还 是 由 于 集合 成 员 的 平均 值 计 算 。 因 此 , 平均 表 
征 的 形成 机 制 仍然 是 一 个 有 待 解决 的 问题 。 解 决 这 个 问题 的 一 个 思路 就 是 分 离 集 
合 平均 刺激 的 特征 值 和 集合 各 成 员 特 征 值 的 平均 , 而 平均 面孔 由 于 其 吸引 力 通常 
都 比 合成 平均 面孔 的 成 员 吸引 力 平 均值 更 高 (Carragher et al., 2018; Komori et al., 
2009)， 很 适合 作为 这 个 问题 解决 的 切入 点 。 为 了 有 效 区 分 平均 刺激 的 表征 和 平 
均值 计算 的 混淆 问题 , 本 研究 通过 利用 集合 面孔 吸引 力 的 平均 表征 和 集合 中 所 有 
面孔 的 吸引 力 平均 值 的 差异 性 来 考察 知觉 平均 过 程 中 是 否 形成 了 平均 刺激 的 表 
征 。 

1.1 平均 表征 形成 机 制 的 争议 


己 往 研究 对 平均 表征 的 形成 方式 提出 了 两 种 主要 解释 , 即 基于 分 布 式 注意 的 
整体 编码 和 基于 聚焦 注意 的 个 体 编码 。 整体 编码 观点 认为 , 视觉 系统 对 集合 刺激 
进行 平行 加 工 ， 因而 被 试 能 够 准确 表征 集合 平均 值 ， 却 不 能 够 对 集合 内 的 个 体 进 
行 准确 表征 (Ariely，2001)。 个 体 编码 观点 则 认为 ， 视 觉 系 统 将 有 限 的 注意 资源 
集中 在 从 集合 中 抽取 的 少数 样本 上 ,并 对 其 进行 精细 加 工 , 然后 通过 样本 信息 的 
平均 值 计 算 来 推断 集合 的 平均 表征 (de Fockert & Marchant, 2008; Myczek & 
Simons, 2008)。 

从 一 般 视觉 加 工 的 角度 看 , 视觉 信息 的 加 工 是 分 层级 的 。 关于 整体 编码 和 个 
体 编码 的 争论 某 种 程度 上 可 以 归结 为 在 平均 表征 形成 过 程 中 整体 和 个 体 的 视觉 
加 工 层 级 优先 性 。 最 近 ， 视 觉 加 工 的 逆 层 级 理论 (Reverse Hierarchy Theory, 
Hochstein & Ahissar, 2002; Hochstein et al.，2015) 认 为 整体 加 工 和 个 体 加 工 存 在 
着 逆 层 级 性 , 即 统计 表征 作为 一 种 由 自 下 而 上 的 快速 过 程 构 建 的 高 水 平 表征 优先 
于 个 体 表 征 的 觉察 。 逆 层级 理论 认为 ， 整 体 表 征 (如 场景 主 由 gisb 的 意识 知觉 从 
高 级 皮层 开始 ， 是 一 种 基于 低级 皮层 输入 的 知觉 过 程 ; 在 视觉 加 工 开 始 阶段 ， 我 
们 仅 能 有 意识 觉察 到 视觉 场景 的 整体 表征 (如 gist)， 不 能 觉察 到 高 水 平整 体 表 征 
的 前 因 细节 (antecedents， 即 构成 整体 表征 的 个 体 细节 );， 在 这 个 优先 的 层级 加 工 
后 , 视觉 系统 才 将 注意 导向 到 特定 的 低级 皮层 处 理 单元 , 提取 局 部 细节 信息 ， 即 
在 高 级 皮层 的 整体 表征 以 自 上 而 下 的 方式 返回 到 局 部 加 工 ( 逆 层 级 返回 ，reverse 
hierarchy return) 以 证 实 (或 矫正 ) 初 步 的 整体 表征 估计 值 (Hochstein et al., 2015). 
因此 , 根据 逆 层 级 理论 可 以 推论 , 平均 表征 最 先是 大 脑 整合 粗略 的 个 体 信 息 形 成 
的 ， 并 非 基 于 精确 个 体 表 征 的 平均 计算 ;但 在 加 工 后 期 会 受到 个 体 表征 的 矫正 。 
然而 ， 这 仅仅 是 个 推论 ， 有 待 更 直接 的 证 据 证 实 。 

1.2 集合 吸引 力 高 评 现象 和 平均 面孔 吸引 力 

和 表情 、 身 份 等 其 他 面孔 特征 类 似 , 学 者 也 曾经 推测 面孔 集合 平均 吸引 力 应 
等 于 每 张 面孔 吸引 力 的 平均 值 (Abbas & Duchaine, 2008; Brady & Alvarez, 2015; 
Haberman & Whitney，2012)。 早 期 研究 发 现 ， 由 三 个 不 同 吸引 力 水 平 的 年 轻 男 
性 面孔 组 成 的 集合 的 吸引 力 刚好 等 于 三 个 男性 的 平均 吸引 力 (Anderson，1965; 
Anderson et al., 1973). 

然而 ， 研 究 者 也 发 现 了 不 同 的 结果 。Van Osch 等 人 (2015) 系 统 地 操纵 了 集 


合 的 容量 大 小 ,发 现 当 集合 中 的 面孔 数量 超过 6 张 , 集合 的 吸引 力 评 分 要 显著 高 
于 集合 成 员 的 评分 的 平均 值 。 这 被 称 为 集合 吸引 力 高 评 现象 (group attractiveness 
effecb)。 小 容量 面孔 集合 在 特定 条 件 下 也 存在 集合 吸引 力 高 评 现象 : 例如 Willis 
(1960) 发 现在 集合 只 有 两 张 或 三 张 面 孔 时 ， 集 合 吸引 力 的 评分 要 比 成 员 的 平均 值 
更 极端 ， 高 吸引 力 集合 的 评分 会 比 成 员 平 均 评分 更 高 。 

Van Osch 等 人 (2015) 认 为 集合 吸引 力 高 评 现象 可 能 的 机 制 是 面孔 集合 的 知 
觉 加 工 形 成 了 平均 面孔 的 表征 , 即 面孔 集合 的 平均 吸引 力 表征 并 不 是 成 员 吸引 力 
数值 的 平均 ， 而 是 被 试 将 集合 中 的 所 有 面孔 加 以 变形 (morph) 加 工 并 融合 成 新 的 
平均 面孔 (average-face)， 从 而 影响 集合 面孔 吸引 力 的 评价 。 面 孔 吸 引力 与 面孔 平 
均 性 具有 强 相关 (O”Toole et al.，1999; Rhodes et al.，2001)， 即 平均 面孔 的 吸引 力 
会 由 于 平均 表征 自身 携带 的 平均 属性 而 得 到 提升 , 进而 高 于 组 成 它 的 所 有 面孔 的 
吸引 力 平均 值 (Carragher et al.，2018)。 

Van Osch 等 人 (2015) 关 于 平均 面孔 的 解释 符合 刺激 集合 形成 平均 刺激 的 表 
征 的 观点 ， 但 并 没有 解释 集合 吸引 力 平 均值 (Anderson et al.，1973; Luo & Zhou, 
2018) 和 集合 吸引 力 高 评 不 一 致 的 矛盾 。 我 们 认为 这 并 不 矛盾 ， Anderson 等 (1973) 
的 研究 都 采取 了 较 小 的 面孔 集合 WW 二 3 或 4), 而 高 评 结果 出 现 于 较 大 的 集合 (N 宇 
8)(Van Osch et al.，2015)。 正 是 这 种 集合 大 小 的 差异 可 能 引起 不 一 致 的 结果 : 即 
相对 于 大 集合 面孔 , 集合 较 小 时 加 工资 源 足 以 对 个 体 成 员 精 确 加 工 , 个 体 成 员 表 
EERE, 更 容易 干扰 平均 面孔 表征 。Li 等 人 (2016) 的 发 现 为 这 个 观点 提供 了 支 
持 证 据 : 在 有 限 的 加 工资 源 下 ,平均 表征 相对 于 个 体 的 表征 具有 优势 性 ,个 体 表 
征 的 精确 度 较 低 ; 但 如 果 加 工资 源 比较 充足 , 个 体 表 征 精 确 度 上 升 ， 而 平均 表征 
的 精确 度 则 降低 。 根 据 逆 层级 理论 ， 平均 表征 的 形成 不 需要 精确 的 个 体 表征 ， 而 
数值 的 计算 需要 建立 在 较 高 的 个 体 表 征 精确 度 之 上 。 此 外 , 平均 面孔 的 吸引 力也 
受 集合 面孔 数量 的 影响 , 即 小 容量 集合 面孔 合成 的 平均 面孔 吸引 力也 低 于 大 集合 
合成 的 平均 面孔 (Langlois & Roggman，1990)。 事 实 上 ，Van Osch 等 (2015) 也 发 
现 ， 当 集合 容量 减少 ， 高 评 现象 出 现 的 概率 大 幅 下 降 。 这 可 能 是 由 于 小 容量 集合 
形成 的 平均 面孔 吸引 力 相 对 不 高 或 者 平均 面孔 受到 干扰 , 也 可 能 是 没有 形成 平均 
面孔 而 依赖 于 平均 值 计算 。 因 此 ， 小 容量 集合 面孔 吸引 力 的 高 评 现象 会 减少 ,但 
其 机 制 有 待 厘清 。 


1.3 问题 提出 和 假设 

目前 集合 平均 表征 的 形成 机 制 仍然 停留 在 理论 层面 ， 尚 未 有 直接 的 证 据 。 A 
成 平均 刺激 作为 一 种 可 能 的 机 制 , 能 够 较 好 地 解释 集合 表征 加 工 相 关 的 理论 问题 
和 实验 现象 。 首先, 为 平均 表征 的 整体 编码 和 个 体 编码 之 争 提供 解决 思路 ; 其 次 ， 
为 视觉 加 工 的 逆 层 级 理论 提供 实证 支持 ; 最 后 , 为 集合 面孔 吸引 力 的 高 评 现象 提 
供 实证 解释 ,本 研究 使 用 平均 辨别 任务 (实验 1 和 2,mean discrimination paradigm, 
Haberman & Whitney，2009) 和 吸引 力 评 价 任 务实 验 3 和 4)， 通 过 比较 集合 吸 
引力 和 平均 面孔 的 吸引 力 探讨 集合 吸引 力 高 评 现象 的 机 制 , 以 进一步 厘清 知觉 平 
均 过 程 中 是 否 形成 了 平均 刺激 的 表征 ,平均 辨别 任务 要 求 被 试 对 单个 刺激 与 集合 
平均 表征 进行 知觉 比较 , 用 知觉 比较 后 对 集合 平均 表征 的 反应 作为 因 变 量 来 推断 
平均 表征 是 否 存在 。 吸 引力 评价 任务 要 求 被 试 对 集合 整体 和 平均 刺激 进行 评价 ， 
直接 反映 平均 表征 的 知觉 过 程 。 我 们 设置 了 集合 中 包含 平均 面孔 的 条 件 ， 如 果 集 
合 加 工 中 形成 了 平均 面孔 , 那么 集合 原本 有 无 平均 面孔 对 结果 将 没有 影响 ; 如 果 
没有 形成 平均 面孔 , 那么 集合 包含 平均 面孔 将 促进 平均 辨别 过 程 或 是 提升 集合 吸 
引力 。 实 验 1 和 3 通过 比较 在 大 容量 集合 中 包含 或 包含 平均 面孔 刺激 这 两 种 条 件 
下 按键 的 比例 来 为 集合 平均 面孔 的 形成 提供 更 直接 的 证 据 , 实验 2 和 4 通过 比较 
不 同 集合 容量 中 集合 平均 面孔 与 集合 吸引 力 的 关系 是 否 发 生变 化 来 为 平均 表征 
的 形成 和 平均 值 计算 的 争议 提供 实验 数据 支持 。 此 外 , 通过 扩散 模型 分 析 结 果 探 
究 集 合 加 工 过程 , 为 实验 1 和 2 提供 信息 加 工 过 程 方面 的 证 据 。 根 据 平均 表征 形 
成 机 制 的 不 同 观点 ， 可 以 对 实验 的 结果 有 如 下 预测 : 

(1) 如 果 平 均 表 征 是 通过 集合 成 员 的 吸引 力 平 均值 计算 ， 那 么 由 于 平均 面孔 
的 高 吸引 力 , 包含 平均 面孔 刺激 的 集合 会 比 不 包含 平均 面孔 刺激 的 集合 吸引 力 更 
高 ， 更 接近 平均 面孔 吸引 力 ， 从 而 当 集 合 包含 平均 面孔 ， 集 合 吸引 力 会 提高 〈 实 
验 3 和 4)， 在 平均 辨别 任务 中 判断 集合 吸引 力 更 高 的 倾向 增加 ， 判 断 探 测 刺 激 
平均 面孔 吸引 力 更 高 的 比例 降低 ， 并 且 不 受 集合 大 小 的 影响 (实验 1 和 2)。 

(2) 如 果 平 均 表 征 是 通过 形成 平均 刺激 的 表征 来 产生 ， 那 么 集合 中 是 否 包 含 
平均 面孔 刺激 对 平均 辨别 任务 和 评分 任务 没有 影响 (实验 1 和 3)， 并 且 在 平均 面 
孔 受 干扰 的 小 集合 中 ， 包 含 平 均 面 孔 刺激 的 集合 吸引 力 更 接近 平均 面孔 吸引 力 
《实验 4)， 从 而 判断 探测 刺激 平均 面孔 吸引 力 更 高 的 比例 降低 (实验 2)。 


(3) 在 假设 2 的 基础 上 , 如果 小 集合 平均 面孔 受 干扰 是 高 评 现象 减少 的 原因 ， 
那么 在 个 体 表 征 较为 突出 的 情况 下 , 集合 吸引 力 和 平均 面孔 吸引 力 的 差异 在 不 包 
含 平均 面孔 刺激 的 集合 条 件 下 更 大 〈 实 验 4)， 进 而 ， 小 集合 判断 探测 刺激 平均 
面孔 吸引 力 更 高 的 比例 在 不 包含 平均 面孔 刺激 的 集合 条 件 下 更 高 (实验 2)。 

(C4) 如果 小 集合 平均 面孔 吸引 力 相对 大 和 集合 而 言 较 低 是 高 评 现 象 减 少 的 原因 ， 
那么 小 集合 中 平均 面孔 吸引 力 下 降 导致 集合 吸引 力 和 平均 面孔 的 差异 更 小 (实验 
3 和 实验 4 对比), 进 而 ,小 集合 判断 探测 刺激 平均 面孔 吸引 力 更 高 的 比例 更 低 ( 实 
验 1 和 实验 2 对 比 )。 


2 实验 1: 大 容量 面孔 集合 加 工 中 是 否 形成 平均 面孔 

实验 1 通过 平均 辨别 任务 , 要 求 被 试 选择 集合 吸引 力 和 平均 面孔 吸引 力 之 间 
较 高 的 一 个 ， 操 纵 集 合 中 是 否 出 现 平均 面孔 ， 进 而 判断 平均 面孔 是 否 形 成 。 
2.1 方法 

CD 被 试 

采用 GPower 以 统计 功效 power=0.8， 中 等 效应 量 £90.25 和 重复 测量 2( 自 变 
量 集合 类 型 : 2 个 水 平 ) 为 参数 估计 的 最 小 样本 量 为 N=34。 实 际 招 募 中 国人 民 大 
学 在 校生 34 名 (其 中 18 名 女性 )， 平 均 年 龄 20.75 岁 ， 标 准 差 2.02， 右 利 手 ， 视 
力 或 矫正 视力 正常 。 本 研究 中 所 有 被 试 均 签署 知情 同意 书 , 实验 得 到 了 中 国人 民 
大 学 心理 学 系 伦理 委员 会 的 批准 。 

(2) 实验 材料 

为 了 产生 足够 的 组 间 差 异 , 选取 了 互联 网 材料 作为 吸引 力 极 高 和 极 低 的 面孔 
图 片 ， 去 除 头 发 、 脖 子 和 耳 杂 ,将 面部 轮廓 前 成 椭圆 形 ， 并 转换 成 灰 度 图 像 来 进 
行 标准 化 。 部 分 面孔 材料 选 自 中 国 化 面孔 情绪 图 片 系统 〈 王 妍 ， 罗 跃 嘉 ，2005) 
中 的 女性 -中 性 情绪 库 。 中 国 化 面孔 情绪 图 片 系统 中 选取 的 图 片 与 互联 网 材料 共 
同 组 成 原始 材料 .所 有 材料 都 经 过 20 名 中 国 大 学 生 在 吸引 力 水 平和 情绪 效 价 ( 均 
为 101 点 量 表 评分 ) 上 的 评分 (10 名 女性 ， 平 均 年 龄 为 20.54 岁 ， 标 准 差 2.17), 
其 中 被 评价 为 非 中 性 (与 评分 50 有 显著 差异 ) 的 材料 被 剔除 。 选 定 的 材料 效 价 
评分 (M 249.994, SD = 0.77) 与 中 性 (评分 50) 没有 显著 差异 ，1(19) = 0.35，P 
= 0.732。 评 定 后 选择 的 原始 面孔 30 张 ， 其 中 包含 6 张 互 联网 材料 〈 其 中 4 张 属 
于 高 吸引 力 组 ，2 张 低 吸引 力 组 )， 其 余 24 张 图 片 从 中 国 化 面孔 情绪 图 片 库 中 选 


取 。 

根据 吸引 力 评分 将 原始 材料 分 为 吸引 力 高 中 低 三 组 ， 每 组 10 张 图 片 。 高 、 
中 、 低 吸引 力 组 的 平均 分 分 别 为 76.33; 43.12; 22.42。 重复 测量 方差 分 析 检 验 三 组 
评分 之 间 的 差异 发 现 差异 显著 ，F(2,38) = 148.64. p < 0.001, np? = 0.89。 两 两 比 
较 差异 显著 , 低 吸 引力 组 与 中 吸引 力 组 : (19) = 7.91, p < 0.001, Cohen's d = 3.63; 
中 吸引 力 与 高 吸引 力 组 : 1119) = 9.77, p «0.001, Cohen'sd = 4.48; 低 吸 引力 组 
与 高 吸引 力 组 : 1(19) = 15.92, p < 0.001, Cohen'sd 2 7.30。 随 后 我 们 设置 来 自 不 
同 吸引 力 分 组 的 面孔 组 成 的 集合 ， 每 个 集合 中 的 图 片 数 量 包 含 11 张 ，12 张 两 种 
情况 ， 实 验 1 共 60 个 集合 。 在 单个 集合 中 不 同 吸 引力 分 组 的 图 片 被 使 用 的 次 数 
不 同 , 而 每 个 实验 所 用 的 所 有 集合 中 , 不 同 吸引 力 分 组 的 图 片 总 共 被 使 用 的 次 数 
是 相同 的 。 

随后 ， 用 面孔 合成 软件 Abrosoft FantaMorph (Abrosoft Fantamorph.5.4.8， 
www.fantamorph.com) 将 不 同 面孔 集合 的 平均 面孔 制作 出 来 ， 共 有 365 张 。 该 
软件 可 以 将 两 张 面孔 按照 一 定 的 比例 融合 ， 将 面部 各 特征 以 众多 关键 点 来 标注 ， 
如 嘴角 的 位 置 ， 大 小 ， 弧 度 ， 随 后 取 关 键 点 的 平均 值 来 合成 图 像 。 例 如 ， 当 我 们 
希望 制作 4 张 原始 面孔 的 平均 面孔 ， 就 将 原始 面孔 两 两 一 组 ， 再 按照 50:50 的 比 
例 进行 合成 取 中 ， 将 合成 的 两 张 图 片 再 次 按照 50:50. 比例 合成 ， 就 相当 于 每 张 原 
始 面孔 在 合成 面孔 的 贡献 比例 为 23%, 得 到 了 4 张 原始 平均 面孔 的 平均 面孔 。 如 
果 要 制作 3 张 原始 面孔 的 平均 面孔 ， 则 控制 每 张 面孔 的 贡献 比例 为 33.3% 即 可 。 

所 有 的 面孔 图 片 再 次 经 过 20 名 中 国人 民 大 学 在 校生 的 吸引 力 评定 (10 名 女 
性 ， 平 均 年 龄 为 20.35 岁 ， 标 准 差 2.03)， 作 为 事先 评定 的 得 分 。 

所 有 实验 材料 使 用 24 英寸 的 Dell 显示 屏 呈 现 ， 分 辩 率 为 1920X 1080, 灰色 
背景 ， 被 试 直 坐 时 双眼 距离 显示 屏 距离 约 为 70cm。 

(3) 实验 设计 

采用 单 因素 被 试 内 设计 ， 自 变量 为 集合 类 型 (无 平均 面孔 的 集合 G1 vs. AF 
均 面 孔 的 集合 G2)， 因 变量 为 判断 平均 面孔 吸引 力 更 高 的 比例 和 扩散 模型 分 析 得 
到 的 反应 决策 指标 〈 信 息 累 积 速 率 v. BUR ZEE a 和 非 决 策 加 工时 长 0， 详 见 结 
果 部 分 )。 

(4) 实验 程序 


实验 采用 平均 辨别 任务 ， 先 呈现 集合 刺激 ， 再 呈现 探测 刺激 。 探 测 刺激 为 集 
合 平均 面孔 、 集 合成 员 面 孔 、 非 成 员 非 平均 面孔 。 由 于 和 平均 面孔 以 及 集合 平均 
值 的 大 小 关系 不 确定 ， 难 以 对 结果 进行 推断 ， 后 两 种 刺激 类 型 在 本 研究 中 只 作为 
反应 填充 刺激 控制 条 件 )。 

在 集合 刺激 类 型 上 , 使 用 12 张 原始 面孔 组 成 集合 ， 即 是 “不 包含 平均 面孔 的 
集合 G1” 水 平 ， 如 果 使 用 11 张 原始 面孔 组 成 集合 ， 并 将 集合 成 员 的 平均 面孔 作 
为 新 成 员 进 入 集合 中 ， 即 是 “包含 平均 面孔 的 集合 G2” 水 平 。 包 含 平均 面孔 的 集 
合 中 , 平均 面孔 的 位 置 随机 呈现 。 在 探测 刺激 类 型 上 ， 呈现 集合 成 员 的 平均 面孔 
即 是 “集合 平均 面孔 ?水平 ， 当 集合 刺激 包含 平均 面孔 时 ， 相 当 于 平均 面孔 出 现 两 
次 ;“ 旦 现 集合 成 员 之 一 ”的 水 平 中 ,呈现 集合 中 除了 平均 面孔 以 外 的 其 他 成 员 面 
和 孔 之 一 ; 呈现 集合 刺激 中 没有 出 现 过 的 面孔 即 是 “新 面孔 ”水 平 。 

在 每 个 试 次 中 ， 被 试 首先 注视 中 心 点 1000ms， 随 后 ， 他 们 看 到 呈现 在 屏幕 
上 的 集合 刺激 2000ms， 之 后 呈现 空 屏 300ms， 随 后 呈现 一 张 探 测 面孔 ， 呈 现 到 
出 现 反应 为 止 。 要 求 被 试 按 F 或 了 键 判断 集合 刺激 的 整体 吸引 力 和 探测 刺激 的 个 
体 吸引 力 哪 个 更 高 ， 共 180 个 试 次 ， 各 个 条 件 混合 随机 呈现 ， 每 60 个 试 次 休息 
一 次 。 在 探测 面孔 为 新 面孔 和 集合 成 员 之 一 两 种 条 件 下 ， 一 半 探 测 刺激 在 预 评 中 
的 吸引 力 高 于 集合 刺激 成 员 吸引 力 平均 值 ， 一 半 低 于 平均 值 (如 图 1)。 


OÓ 


注视 点 1000ms 


集合 刺激 
2000ms 


探测 刺激 持续 至 反应 
F— J 


图 1 实验 1、2 流程 图 。 


集合 刺激 以 4X3 和 天 阵 呈 现 ， 单 张 面 孔 图 片 的 视角 为 5.69” X 6.53” 。 探 测 刺 
激 材料 是 一 张 单独 的 面孔 , 呈现 在 屏幕 中 央 , 图 片 尺寸 与 集合 成 员 刺 激 尺寸 一 致 。 

(5) 扩散 模型 

根据 道 层级 理论 ,平均 面孔 的 形成 尽管 快速 , 但 仍然 需要 信息 累积 ， 因 而 有 
可 能 在 包含 和 不 包含 平均 面孔 的 集合 之 间 产 生 决 策反 应 差异 。 为 了 考察 这 种 可 能 
的 差异 ， 我 们 分 析 了 反应 决策 信息 ， 采 用 扩散 模型 (the diffusion model; Ratcliff， 
1978; Ratcliff & McKoon, 2008) 将 不 同 的 认 知 过 程 进行 分 解 ， 综 合 利用 反应 时 
分 布 与 反应 准确 性 结果 , 进一步 分 析 包 含 和 不 包含 平均 面孔 对 集合 面孔 吸引 力 的 
知觉 机 制 。 该 模型 可 以 将 分 解 的 认 知 过 程 对 应 到 不 同 的 模型 参数 中 (Voss et al., 
2013). 

扩散 模型 的 基本 假设 是 : 在 快速 的 二 选 一 任务 中 , 信息 从 起 始点 不 断 累 积 
到 达到 某 反 应 的 阔 限 标准 后 激活 反应 。 基 本 扩散 模型 (Ratcliff，1978) 有 四 个 参数 
(如 图 2), 43073: 

1) 漂移 率 (drift rate)， 记 为 v， 表 明 信 息 累积 的 速率 ; 

2) AIRE (threshold separation)， 记 为 a， 表 明 做 决策 所 需要 的 信息 量 ; 

3) 起 始点 (starting point)， 记 为 z， 表 明 决 策 前 的 预先 偏向 ; 

4) 非 决策 加 工时 长 (duration of nondecisional processes)， 记 为 t0, 包含 编码 、 
反应 执行 等 非 决 策 的 时 间 。 


正确 反应 的 反应 时 分 布 
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错误 反应 
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错误 反应 的 反应 时 分 布 


图 2 扩散 模型 (翻译 自 Ratcliff & McKoon, 2008, Figure 2)。 图 中 展示 了 扩散 模型 的 三 


条 路 径 样 例 。 信 息 从 起 始点 (Z) 以 平均 速率 (V) 开 始 逐 渐 累 积 ， 直 到 达到 反应 A WARR 


应 B 的 阅 限 (0)。 由 于 随机 噪音 ， 这 些 路 径 在 每 个 试 次 之 间 都 有 所 变异 。 
2.2 结果 

C1) 按键 反应 结果 

我 们 根据 预 评 吸 引力 分 数 计算 了 在 探测 刺激 类 型 为 控制 条 件 刺激 的 反应 正 
确 率 ， 以 此 确定 被 试 进行 了 充分 理解 和 正确 反应 ， 同 时 验证 事先 评定 的 吸引 力 评 
分 是 否 适 用 于 本 实验 的 被 试 。 根 据 预 评分 数 计算 集合 成 员 的 吸引 力 平 均值 ， 再 和 
预 评 的 探测 面孔 吸引 力 比 较 来 确定 正确 反应 , 结果 表明 探测 刺激 类 型 为 新 面孔 和 
集合 成 员 之 一 两 种 条 件 下 的 总 正确 率 达 到 84.72%， 远 高 于 随机 反应 ，133) = 
28.21, p < 0.001，95%CI= [0.32, 0.37], Cohen’s d= 9.82。 说 明 被 试 的 吸引 力 判 
断 和 事先 评定 基本 一 致 。 根据 事先 评定 的 得 分 , 我 们 分 别 统 计 了 实验 1 中 不 含 平 
均 面孔 的 集合 中 探测 刺激 为 平均 面孔 的 条 件 下 所 有 集合 成 员 吸引 力 的 平均 值 M1 
= 49.19, 同时 假设 该 集合 合成 了 平均 面孔 并 计算 包含 了 该 平均 面孔 的 集合 成 员 吸 
引力 平均 值 , 也 就 是 假设 生成 了 平均 面孔 并 将 其 吸引 力 计算 进 集合 的 成 员 平 均值 
M2 = 50.49。M1 和 M2 的 差异 表明 ,合成 平均 面孔 提高 了 集合 吸引 力 平均 值 , 1(19) 
=22.82, p < 0.001, 95%CI=[1.14, 1.37], Cohen’s d = 10.47. 

我 们 统计 了 实际 反应 中 判断 探测 刺激 平均 面孔 吸引 力 更 高 的 比例 。 无 论 集合 
中 包含 和 不 包含 平均 面孔 , 被 试 判断 平均 面孔 吸引 力 更 高 的 比例 (不 包含 平均 面 
fL G1: 84.03%, 包含 平均 面孔 G2: 83.55%) 都 显著 高 于 随机 概率 (50%), 1(33) 
= 8.16, p < 0.001, 95%CI = [0.25, 0.42]. Cohen's d = 2.84; 1(33) = 10.31, p < 0.001, 
95%CI = [0.27, 0.40], Cohen'sd = 3.39。 当 探测 刺激 为 平均 面孔 ， 判 断 平均 面孔 
吸引 力 更 高 的 比例 在 包含 平均 面孔 、 不 包含 平均 面孔 的 集合 类 型 之 间 没 有 显著 差 
异 (如 图 3)，133) 20.11, p = 0.912，95%CI = [-0.10，0.11]， 表 明 有 无 平均 面孔 
对 集合 吸引 力 的 知觉 辨别 没有 显著 影响 。 
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图 3 不 同 条 件 下 被 试 判断 平均 面孔 吸引 力 更 高 的 比例 ( 注 : G1 为 不 包含 平均 面孔 的 集 
合 、G2 为 包含 平均 面孔 的 集合 ) 


(2) 扩散 模型 分 析 

前 述 比 例 分 析 虽 然 表 明 有 无 平均 面孔 对 集合 吸引 力 的 知觉 辨别 没有 显著 影 
响 ， 但 并 不 清楚 对 辨别 决策 过 程 (如 辨别 时 间 、 决 策 标准 等 ) 有 无 影响 。 这 里 我 们 
采用 层级 扩散 模型 方法 (the hierarchical diffusion model, HDM; Vandekerckhove et 
al.，2011) 进 行 数据 的 模型 拟 合 。HDM 分 析 的 优势 在 于 在 模型 参数 计算 时 考虑 被 
试 之 间 的 个 体 差异 。 此 外 模型 上 下 限 分 别 设 定 为 正确 反应 和 错误 反应 , 在 探测 刺 
激 为 平均 面孔 条 件 时 , 将 判断 探测 刺激 吸引 力 更 高 设 定 为 正确 反应 。 由 于 对 于 正 
确 和 错误 反应 不 存在 预先 的 反应 偏向 ， 因 此 模型 将 起 始点 (z) 设 置 为 4/2。 模型 的 
其 他 参数 设 定 为 随 研 究 变 量 ( 集 合 类 型 ， 探 测 刺激 类 型 ) 变 化 。 通 过 层级 扩散 模型 
拟 合 ， 最 终 得 到 每 个 被 试 在 每 个 条 件 下 的 漂移 率 v， 姜 限 差 值 a 和 非 决 策 加 工时 
长 0， 并 进行 统计 检验 分 析 ( 如 图 4). 

扩散 模型 是 对 每 个 被 试 进行 单独 拟 合 ， 一 般 认为 ， 如 果 模 型 拟 合 优 度 参数 
Rhat 小 于 1.05(Vehtari et al., 2019)， 则 拟 合 度 较 优 ， 我 们 对 实验 1 的 拟 合 结果 进 
行 单 样本 7 检验 发 现 ， 各 拟 合 参数 (OM = 1.00) 均 显 著 小 于 1.05， 表 明 模 型 拟 合 
良好 。 

以 模型 参数 为 因 变 量 的 1 检验 表明 ， 在 信息 累积 漂移 率 v 和 冰 限 差 值 a 上 ， 和 集 
合 是 否 包含 平均 面孔 没有 显著 差异 ，1(33) = 0.48，P = 0.632; 1(33)= 1.72, p= 
0.096. 表明 其 不 影响 对 集合 吸引 力 和 平均 面孔 的 辨别 ; 但 非 决策 加 工时 长 {0 受到 
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了 集合 是 否 包含 平均 面孔 条 件 的 影响 , 集合 包含 平均 面孔 条 件 所 需 的 t0 更 短 , (33) 
p =0.015, 95%CI=[0.01, 0.06], Cohen's d = 0.90. 


B1 日 G2 


图 4 实验 1、 实 验 2 获得 的 层级 扩散 模型 拟 合 结果 《〈 注 : G1 为 不 包含 平均 面孔 的 集合 、 
G2 为 包含 平均 面孔 的 集合 ) 


Dp 


2.3 讨论 

实验 1 的 结果 表明 ， 容 量 为 12 的 集合 面孔 吸引 力 确实 存在 高 评 现象 。 这 种 
高 评 现象 来 自 合成 平均 面孔 的 更 高 吸引 力 , 并 影响 了 被 试 对 集合 吸引 力 和 探测 刺 
激 平均 面孔 的 比较 ， 使 得 与 实际 包含 平均 面孔 的 集合 条 件 结果 没有 差异 。 实 验 结 
果 模 式 符 合 假设 2 的 合成 平均 刺激 ,不 支持 假设 1 的 平均 值 计 算 。 因 此 ， 平 均 辨 
别 并 不 是 简单 地 通过 计算 集合 原 有 成 员 的 平均 值 , 而 是 形成 了 集合 平均 面孔 。 由 
于 平均 面孔 的 高 吸引 力 , 有 平均 面孔 集合 所 有 成 员 的 平均 值 高 于 无 平均 面孔 的 集 
合 的 成 员 平 均值 , 更 接近 探测 刺激 平均 面孔 ,从 而 探测 刺激 和 集合 吸引 力 更 不 易 
区 分 。 因 而 ， 如 果 是 根据 平均 值 计算 来 完成 平均 辨别 任务 ( 即 成 员 平 均值 是 比较 
标准 )， 故 而 有 平均 面孔 条 件 下 判断 平均 面孔 吸引 力 更 高 的 比例 将 低 于 无 平均 面 
TLIE. 但是， 结果 与 此 预测 相反 ， 判 断 平均 面孔 吸引 力 更 高 的 比例 在 包含 平均 
面孔 、 不 包含 平均 面孔 的 集合 类 型 之 间 没 有 显著 差异 。 因 此 ， 更 可 能 的 是 ， 人 们 
在 知觉 集合 刺激 时 将 成 员 合成 为 一 张 新 面孔 〈 即 具有 高 吸引 力 的 平均 面孔 )， 从 
而 对 不 包含 平均 面孔 的 集合 吸引 力 造 成 显著 的 提高 ;而 在 包含 平均 面孔 的 条 件 
中 , 整个 集合 形成 的 平均 面孔 应 该 等 同 于 其 中 的 11 张 原始 面孔 形成 的 平均 面孔 ， 
也 就 是 集合 中 已 经 出 现 的 这 张 平均 面孔 。 那 么 平均 面孔 出 现在 集合 中 就 不 应 当 对 
集合 吸引 力 造 成 显著 的 提高 ， 故 包含 /不 包含 平均 面孔 的 条 件 中 选择 集合 整体 吸 
引力 更 高 的 比例 不 存在 差异 。 


扩散 模型 分 析 结 果 表 明 , 在 没有 实际 平均 面孔 的 输入 时 , 编码 加 工 等 非 决 策 
时 间 更 长 ， 这 说 明 平 均 辨 别 任务 过 程 中 形成 平均 面孔 需要 加 工时 间 和 资源 的 投 
入 。 这 个 过 程 是 很 快 的 ( 约 400ms )， 因 而 对 决策 影响 不 大 ， 从 而 决策 信息 累积 
速度 与 有 实际 平均 面孔 输入 时 没有 显著 差异 。 

总 结 而 言 , 实验 1 的 结果 表明 集合 吸引 力 的 判断 过 程 形 成 了 平均 面孔 ， 从 而 
导致 集合 吸引 力 高 评 。 那 么 有 什么 因素 会 影响 平均 面孔 的 形成 呢 ? 近期 研究 发 
现 ， 高 级 特征 如 面孔 表情 的 平均 表征 是 个 容量 有 限 的 过 程 Ji et al.，2018)， 受 到 
加 工资 源 的 制约 (Li et al.，2016)。 那 么 ， 面 孔 吸 引力 的 平均 表征 是 否 也 受到 容量 
的 影响 ”从 以 往 的 结果 看 ， 答 案 似乎 是 肯定 的 。 例 如 ，Van Osch(2015) 发 现 ， 在 
集合 容量 为 4~6 的 集合 中 ,集合 吸引 力 高 评 现象 出 现 的 可 能 性 很 低 。 以 往 发 现 面 
孔 集 合 吸引 力 相 当 于 成 员 平 均值 的 研究 也 都 采用 的 是 较 小 的 集合 (Anderson， 
1965; Anderson et al.，1973)。 这 是 否 说 明 小 容量 集合 中 没有 平均 面孔 形成 ， 小 集 
合 面 孔 吸 引力 判断 存在 与 大 容量 集合 不 同 的 机 制 ? 但 还 存在 另外 一 种 可 能 , 即 平 
均 面孔 确实 形成 了 但 受到 干扰 。 为 了 分 离 这 两 种 可 能 , 实验 2 考察 了 小 容量 集合 
吸引 力 与 平均 面孔 的 关系 。 


3 实验 2: 集合 容量 对 面孔 集合 加 工 的 影响 

实验 2 采用 4 张 面孔 组 成 的 集合 , 采用 与 实验 1 相同 的 实验 设计 和 程序 , 考 
察 了 容量 对 集合 吸引 力 与 平均 面孔 的 关系 的 影响 。 
3.1 方法 

(1) 被 试 

采用 GPower 以 统计 功效 power=0.8， 中 等 效应 量 大 0.25 和 重复 测量 2( 自 变 
量 集合 类 型 : 无 平均 面孔 的 集合 G1 vs. 有 平均 面孔 的 集合 G2) 为 参数 估计 的 最 
小 样本 量 为 N=34。 实际 招募 中 国人 民 大 学 在 校生 35 名 大 学 生 , 排除 一 名 记 错 按 
键 方向 的 被 试 ， 有 效 被 试 34 名 (17 名 女性 )， 平 均 年 龄 20.68 岁 ， 标 准 差 2.27, 
右 利 手 ， 视 力 或 矫正 视力 正常 。 

(2) 实验 材料 

与 实验 1 相同 ， 但 集合 刺激 只 包含 4 张 图 片 。 在 集合 刺激 类 型 上 ， 使 用 4 
张 原始 面孔 组 成 集合 ， 即 是 “不 包含 平均 面孔 的 集合 G1” 水 平 ， 如 果 使 用 3 张 原 


始 面孔 组 成 集合 ， 并 将 集合 成 员 的 平均 面孔 作为 新 成 员 进 入 集合 中 ， 即 是 “包含 
平均 面孔 的 集合 G2” 水 平 。 探 测 刺激 类 型 包括 集合 平均 面孔 、 集 合成 员 面 孔 、 非 
成 员 非 平均 面孔 ， 探 测 刺激 的 后 两 种 刺激 类 型 是 控制 条 件 刺 激 。 

集合 刺激 以 2x2 矩阵 呈现 ， 图 片 的 尺寸 为 8.19°x 9.43"。 探 测 刺 激 材 料 是 一 
张 单独 的 面孔 ， 呈 现在 屏幕 中 央 ， 图 片 尺寸 与 集合 刺激 尺寸 一 致 。 

(3) 实验 设计 

和 实验 1 相同 。 每 个 被 试 在 主任 务 完 成 后 还 对 每 张 图 片 进行 了 吸引 力 评分 。 

(4) 实验 程序 

与 实验 1 相同 。 
3.2 结果 

(1) 按键 反应 结果 

根据 事先 评定 的 得 分 , 在 探测 刺激 类 型 为 新 面孔 和 集合 成 员 两 种 条 件 下 的 反 
以 正确 率 为 84.1796, 显著 高 于 随机 水 平 , 1(33) = 16.84, p < 0.001, 95%CI = [0.31, 
0.39], Cohen's d = 5.83, 以 此 确定 被 试 确实 充分 理解 和 正确 反应 。 与 实验 1 相似 ， 
分 别 统 计 了 探测 刺激 为 平均 面孔 的 条 件 下 不 含 平均 面孔 的 集合 中 所 有 成 员 吸引 
力 的 平均 值 MI = 47.82, 同时 也 假设 该 集合 生成 了 平均 面孔 并 计算 包含 了 该 平均 
面孔 的 成 员 均 值 M2 = 49.73。M1 和 M2 的 差异 表明 ， 平 均 面 孔 也 同样 提高 了 小 
容量 集合 吸引 力 平均 值 ，1(29) = 6.68, p < 0.001，95%CI = [1.44, 2.47], Cohen's 
d = 2.48。 根 据 被 试 主 任务 后 的 评定 ， 发 现 平 均 面 孔 的 吸引 力 (M = 55.18, SD = 
11.02) 高 于 集合 成 员 面孔 吸引 力 的 平均 值 CM = 51.71, SD = 11.76), t33) = 2.35, 
p=0.020, 95%CI=[0.51, 7.05], Cohen's d = 0.820. 

对 实验 2 和 实验 1 中 平均 面孔 为 探测 刺激 条 件 下 的 平均 面孔 吸引 力 进行 比 
Bt, 结果 表明 小 集合 面孔 形成 的 平均 面孔 吸引 力 更 低 , 57.20 vs. 65.61, 校正 (41.7) 
=100.61, p «0.001, 95%CI = [8.26，8.60]，Cohen's d = 24.53。 对 实验 2 和 实验 
1 中 平均 面孔 (探测 刺激 ) 和 集合 平均 值 的 差 值 (9.51 vs. 16.43) 进 行 跨 实验 比较 ， 发 
现实 验 2 小 集合 平均 面孔 和 集合 平均 值 的 差异 更 小 ， 校 正 (53.8) = 112.13，P < 
0.001, 95%CI=[6.70, 6.94], Cohen’s d =27.53。 因 而 ， 小 集合 中 判断 探测 刺激 
平均 面孔 吸引 力 更 高 的 比例 将 下 降 。 结果 确实 如 此 ,实验 2 中 判断 平均 面孔 吸引 
力 更 高 的 比例 显著 低 于 实验 1(66.57% vs. 83.79%)， 校 正 (63) = 3.37，P = 0.001， 


95%CI = [0.07，0.27]，Cohen's d = 0.85. 
统计 检验 结果 表明 ， 被 试 倾向 于 认为 平均 面孔 的 吸引 力 要 高 于 集合 的 吸引 
力 。 判 断 探测 刺激 平均 面孔 吸引 力 更 高 的 比例 显著 高 于 随机 概率 ，!(33) = 4.60, 
p<0.001, 95%CI=[0.09, 0.24], Cohen'sd = 1.60。 而 且 对 于 判断 平均 面孔 吸引 
力 更 高 的 比例 ， 集 合 中 不 包含 平均 面孔 的 条 件 显著 高 于 包含 平均 面孔 的 条 件 ， 
1(33) = 3.77, p 20.001, 95%CI = [0.03, 0.12], Cohen’s d = 1.31( 如 图 3). 

由 此 可 见 , 小 集合 的 加 工 结果 确实 与 大 集合 不 同 , 为 了 探究 这 种 差异 的 存在 
是 由 于 加 工 机 制 不 同 还 是 平均 面孔 受到 干扰 , 我 们 对 不 含 平 均 面孔 的 集合 中 是 否 
形成 了 平均 面孔 进行 了 检验 。 我 们 通过 匹配 选择 出 与 平均 面孔 吸引 力 接近 的 新 面 
孔 探 测 刺 激 , 两 类 面孔 的 吸引 力 均 值 分 别 为 54.80 vs 54.11, (46) = 0.18, p = 0.859, 
但 探测 刺激 为 平均 面孔 时 探测 刺激 吸引 力 被 判断 为 更 高 的 比例 (69.12%) 仍 然 高 
于 新 面孔 条 件 (52.01%)，1(33) 2 4.84，P < 0.001，95%CI= [10.21%，24.88%]， 
Cohen’s d= 1.69。 即 使 进一步 匹配 选择 出 比 平均 面孔 吸引 力 更 高 的 新 面孔 刺激 
(72.33 vs. 60.86, 1(42) = 3.85, p < 0.001，95%CI= [5.5496, 17.49%], Cohen’s d = 
1.19), 探测 刺激 为 平均 面孔 时 探测 刺激 吸引 力 被 判断 为 更 高 的 比例 (71.01%) 仍 然 
高 于 新 面孔 条 件 (61.31%)，z(33) = 2.62, p = 0.013，95%CI = [2.24%, 17.13%], 
Cohen's d = 0.91。 这 说 明 在 辨别 过 程 中 平均 面孔 并 不 是 作为 新 面孔 出 现 的， 而 更 
可 能 是 集合 呈现 时 形成 了 平均 面孔 。 

我 们 还 计算 了 以 实际 集合 成 员 平 均值 M1 和 假设 形成 了 平均 面孔 后 的 集合 成 
员 平 均值 M2 作为 比较 标准 时 的 正确 率 Accl 和 Acc2。 由 于 平均 面孔 评分 和 集合 
平均 值 的 差 值 较 大 (平均 差异 10.40)， 容 易 出 现 天 花 板 效 应 ， 我 们 只 选择 了 差 值 
IEF 10 的 试 次 计算 Accl 和 Acc2。 如 果 形 成 了 平均 面孔 ， 那 么 集合 吸引 力 提高 ， 
和 探测 刺激 的 平均 面孔 的 差异 减 小 ， 因 而 正确 率 将 降低 ，Acc2 低 于 实际 平均 值 
的 正确 率 Acc1， 从 而 接近 实际 包含 平均 面孔 的 集合 Acc0。t 检验 结果 表明 ， 
Acc2(50.34%) 和 Acc1(53.03%), 1(33)= 1.18. p=0.249, Cohen'sd = 0.42，Acc2 


和 Acc0(45.79%), 1(33) = 1.46, p 20.154, Cohen'sd = 0.51， 都 没有 显著 差异 。 
以 三 个 正确 率 为 自 变 量 的 三 个 水 平 进行 单 因素 趋势 分 析 (trend analysis) RK 
明 从 hccl 到 Acc2 再 到 AccO 存在 线性 递减 趋势 ，F(1，33) = 4.21, p 20.048, ny? 
=0.11。 这 些 结果 表明 ， 尺 管 不 含 平均 面孔 的 小 集合 检测 到 的 平均 面孔 效应 无 法 


完全 与 包含 平均 面孔 的 条 件 相 等 ， 但 合成 平均 面孔 依然 在 一 定 程度 上 起 作用 。 

(2) 扩散 模型 分 析 

实验 2 同样 通过 层级 扩散 模型 拟 合 , 最 终 得 到 每 个 被 试 在 每 个 条 件 下 的 漂移 
率 v, WRZE a 和 非 决策 加 工时 长 (0, 并 进行 统计 检验 分 析 。 各 拟 合 参数 (M = 
1.00) 均 显 著 小 于 1.05， 表 明 模 型 拟 合 良好 。 

以 模型 参数 为 因 变量 的 上 检验 表明 ， 在 阔 限 差 值 a 和 非 决 策 加 工时 长 t0 上， 
集合 是 否 包含 平均 面孔 对 集合 吸引 力 和 平均 面孔 的 辨别 没有 影响 ，!32) = -0.63， 
p = 0.533，!(32) 20.72, p = 0.095; 但 信息 累积 漂移 率 v 受到 了 集合 是 否 包含 平 
均 面 孔 条 件 的 影响 ， 集 合 不 包含 平均 面孔 条 件 的 信息 累积 更 慢 ，!33) = -4.775， 
p<0.001, 95%CI = [-0.63, —0.25], Cohen’s d= 1.66( 如 图 4). 

层级 扩散 模型 的 统计 结果 在 实验 间 存 在 差异 (如 图 4)。 在 非 决策 加 工时 长 t0 
E, 集合 包含 平均 面孔 与 否 和 集合 容量 存在 交互 作用 , F(1,63) = 14.03, p < 0.001, 
np) = 0.18。 简 单 效应 分 析 发 现 ， 在 集合 包含 平均 面孔 条 件 下 ， 实 验 1 的 t0 显著 
小 于 实验 2 fff] tO, 1(63) =-2.568, p=0.013, 95%CI = [-0.09, —0.01], Cohen’s d 
-0.65. 在 漂移 率 v 上 , 同样 存在 集合 包含 平均 面孔 与 否 和 集合 容量 的 交互 作用 ， 
F(1,63) = 9.63, p = 0.003，mp2 = 0.13， 简 单 效 应 分 析 发 现 ， 无 论 集合 包含 或 不 包 
含 平均 面孔 ， 实 验 1 的 v 最 著 大 于 实验 2 的 v, 1(63)=5.51, p « 0.001，95%CI = 
[0.94, 2.00], Cohen'sd = 1.39; 1(63)=3.16, p=0.002, 9596CI- [0.30，1.34]， 


Cohen’s d = 0.80. 
3.3 讨论 

实验 2 发 现 , 在 不 包含 平均 面孔 的 条 件 中 , 判断 平均 面孔 吸引 力 更 高 的 比例 
显著 高 于 包含 平均 面孔 的 条 件 ， 说 明 平均 面孔 出 现在 集合 中 ,显著 地 增加 了 集合 
的 整体 吸引 力 。 由 此 可 见 ， 当 集合 容量 为 4， 被 试 主观 形成 的 平均 面孔 表征 被 抑 
制 或 者 没有 形成 。 如 果 是 平均 面孔 表征 没有 形成 ， 则 平均 面孔 作为 探测 刺激 应 该 
和 新 面孔 类 似 , 但 分 析 表 明 平 均 面 也 和 新 面孔 的 探测 结果 完全 不 同 。 因 而 ,小 集 
合 面孔 也 形成 了 平均 面孔 。 这 些 结果 模式 符合 合成 平均 刺激 的 假设 2， 不 支持 平 
均值 计算 的 假设 1。 

尽管 小 集合 面孔 形成 了 平均 面孔 , 但 平均 辨别 的 反应 模式 和 实验 1 大 集合 并 
不 相同 。 这 可 能 是 因为 小 集合 中 形成 的 平均 面孔 更 容易 受 干扰 ， 因 而 包含 平均 面 


孔 刺激 的 集合 吸引 力 更 接近 平均 面孔 ， 从 而 判断 平均 面孔 吸引 力 更 高 的 比例 降 
低 。 这 也 反映 在 被 试 的 反应 决策 参数 上 ， 决 策 所 需 的 信息 累积 速度 相对 实验 1 
更 慢 , 所 需 的 加 工时 间 更 长 。 扩散 模型 的 结果 表明 , 在 有 实际 平均 面孔 的 输入 时 ， 
辨别 决策 将 更 容易 ， 表 现 为 决策 信息 累积 更 快 。 这 些 结果 说 明 平 均 辨别 任务 过 程 
中 形成 了 平均 面孔 , 只 是 受到 了 干扰 。 这 种 干扰 还 体现 在 小 集合 判断 平均 面孔 吸 
引力 更 高 的 比例 比 实验 1 更 低 。 实 验 结果 表明 ， 这 可 能 来 自 两 个 原因 : 一 是 小 集 
合 平 均 面孔 受 干扰 (假设 3)， 那 么 集合 吸引 力 和 平均 面孔 的 差异 在 不 包含 平均 
面孔 刺激 的 集合 条 件 下 更 大 , 从 而 小 集合 判断 平均 面孔 吸引 力 更 高 的 比例 在 不 包 
含 平均 面孔 刺激 的 集合 条 件 下 更 高 ; 二 是 小 集合 平均 面孔 吸引 力 更 低 , 集合 和 平 
均 面 孔 的 差异 更 小 (假设 4)。 

实验 1 和 实验 2 的 结果 来 自 于 相对 间接 的 平均 辨别 任务 ,为 了 提供 更 直接 的 
证 据 ， 实 验 3 和 实验 4 采用 评分 任务 对 实验 1 和 实验 2 的 结果 进行 进一步 验证 。 


4 实验 3: 大 容量 面孔 集合 的 评分 

实验 3 采用 大 容量 面孔 集合 进行 评分 任务 。 为 不 同 容 量 下 集合 吸引 力 和 平均 
吸引 力 的 关系 提供 更 直观 的 证 据 。 
4.1 方法 

(1) 被 试 

采用 GPower 以 统计 功效 power=0.8， 中 等 效应 量 f20.25 和 单 因素 5 水 平 ( 评 
分 类 型 : 不 包含 平均 面孔 的 集合 的 成 员 均 值 M1、 不 包含 物理 平均 面孔 集合 但 将 
平均 面孔 计算 在 内 的 成 员 均值 M2、 不 包含 平均 面孔 的 集合 G1、 包含 平均 面孔 的 
集合 G2、 平 均 面 筷 Avg) 为 参数 估计 的 最 小 样本 量 为 N=21。 实 际 招募 中 国人 民 
大 学 在 校生 29 名 大 学 生 ， 有 效 被 试 29 名 (15 名 女性 )， 平 均 年 龄 22.14 岁 ， 标 准 
差 3.17， 右 利 手 ， 视 力 或 矫正 视力 正常 。 

(2) 实验 材料 

实验 刺激 与 实验 1 相同 。 

集合 刺激 包含 12 张 面孔 ， 集 合 刺激 以 4x3 矩阵 呈现 ， 单 张 面孔 图 片 的 视角 
为 5.69?x6.53*. 

在 评分 类 型 上 ， 使 用 12 张 原始 面孔 组 成 集合 ， 即 是 “不 包含 平均 面孔 集合 ” 


水 平 ， 如果 使 用 11 张 原始 面孔 组 成 集合 ， 并 将 集合 成 员 的 平均 面孔 作为 新 成 员 
进入 集合 中 ， 即 是 “包含 平均 面孔 集合 "水 平 ， 将 集合 成 员 面 孔 和 平均 面孔 再 次 进 
行 单独 评定 ， 即 为 “单独 评定 ”水 平 。 
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图 5 实验 3、4 流程 图 


(3) 实验 设计 

采用 单 因素 5 水 平 〈 评 分 类 型 : 不 包含 平均 面孔 的 集合 的 成 员 均 值 MT. A 
包含 物理 平均 面孔 集合 但 将 平均 面孔 计算 在 内 的 成 员 均 值 M2、 不 包含 平均 面孔 
的 集合 G1、 包 含 平 均 面孔 的 集合 G2、 平 均 面 孔 Ave) 的 被 试 内 设计 。 因 变量 为 
被 试 对 目标 集合 或 目标 面孔 的 吸引 力 评分 。 

(4) 实验 程序 

实验 流程 如 图 5 R. HEI 500ms 注视 点 ， 而 后 在 屏幕 上 呈现 一 组 面 
孔 或 是 一 张 单独 面孔 ， 被 试 要 对 目标 的 吸引 力 进 行 0 一 100 的 评分 ，0 代表 吸引 
力 最 低 ，100 代表 吸引 力 最 高 。 
4.2 结果 
昌 于 单 张 面孔 的 评分 任务 中 包含 原始 面孔 也 包含 各 个 集合 的 平均 面孔 , 因此 
我 们 随后 使 用 单 张 面孔 的 评分 来 计算 集合 的 吸引 力 平 均值 , 计算 不 包含 平均 面孔 
集合 条 件 下 的 集合 成 员 评 分 均值 ， 得 到 M1 = 47.31; 再 假设 该 集合 生成 了 平均 面 
孔 从 而 计算 包含 了 平均 面孔 的 成 员 均 值 ， 得 到 M2 = 48.78。 将 M1. M2. KEG 
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平均 面孔 条 件 的 集合 吸引 力 G1、 包 含 平 均 面孔 条 件 的 集合 吸引 力 G2 和 平均 面 
孔 吸 引力 Avg 作为 评分 类 型 5 个 水 平 进行 方差 分 析 。 结 果 表 明 ， 评 分 类 型 主 效 
应 显著 , F(4, 112) 227.60, p < 0.001，7112 = 0.50。 多 重 比较 结果 如 下 〈 如 图 6): 

首先 ，M2 显著 大 于 MI, p < 0.001，95%CI= [1.22，1.71]， 再 次 确认 了 合成 
平均 面孔 对 集合 吸引 力 平 均值 的 提升 作用 。 其 次 ,不 包含 平均 面孔 的 集合 吸引 力 
评分 G1 与 包含 平均 的 集合 G2 差异 不 显著 ，p = 0.532; 与 M2 差异 不 显著 , p = 
0.053; 但 大 于 M1，p = 0.011，95%CI= [1.26，8.80]。 第 三 ， 平 均 面孔 吸引 力 显 
著 高 于 整个 集合 的 吸引 力 G1、G2 和 成 员 平 均值 MI. M2, ps <= 0.001。 趋 势 分 
析 表 明 ， 从 集合 成 员 平均 值 、 集 合 吸 引力 到 平均 面孔 ， 存 在 着 逐渐 增加 的 趋势 ， 
F(1, 28) =62.82, p<0.001, np = 0.69。 
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图 6 实验 3、4 吸引 力 评 分 结果 ( 注 : M 为 不 包含 平均 面孔 的 集合 的 成 员 均值 、M2 为 
不 包含 物理 平均 面孔 集合 但 将 平均 面孔 计算 在 内 的 成 员 均 值 `G1 为 不 包含 平均 面孔 的 集合 、 
G2 为 包含 平均 面孔 的 集合 、Avg 为 平均 面孔 ) 


除 此 以 外 , 我 们 也 尝试 了 分 析 平 均 面 孔 和 和 集合 吸引 力 的 差 值 , 发 现在 包含 或 
不 包含 平均 面孔 的 集合 间 差 值 没 有 显著 差异 ，1(28) = 0.19，p = 0.852， 再 次 验证 
了 实验 1 中 被 试 选择 探测 刺激 平均 面孔 吸引 力 更 高 的 比例 在 集合 包含 和 不 包含 
平均 面孔 条 件 下 没有 显著 差异 。 
4.3 讨论 

实验 3 的 评分 任务 结果 基本 重复 了 实验 1 的 结果 。 首先, 在 大 容量 集合 中 的 
评分 任务 验证 了 大 容量 集合 的 集合 吸引 力 高 评 现象 , 即 集合 吸引 力 高 于 集合 成 员 


评分 的 平均 值 。 其 次 ， 平 均 面孔 吸引 力 大 于 集合 吸引 力 ， 说 明了 实验 1 中 被 试 关 
断 探测 面孔 吸引 力 更 高 的 原因 。 第 三 ， 集 合 是 否 包含 平均 面孔 ,对 于 集合 

有 显著 影响 〈 支 持 假设 2， 不 支持 假设 1)， 并 且 ， 不 包含 平均 刺激 的 集合 评分 
G1 只 有 在 考虑 了 生成 平均 面孔 条 件 下 才 接 近 集合 成 员 平均 值 ， 即 M2。 最 后 , S 
势 分 析 和 多 重 比较 结果 表明 , 不 包含 平均 刺激 的 集合 评分 更 接近 于 包含 平均 面孔 
条 件 的 结果 。 这 些 结果 说 明 大 容量 集合 确实 生成 了 平均 面孔 。 


5 实验 4: 小 容量 面孔 集合 的 评分 

实验 4 采用 小 容量 面孔 集合 进行 评分 任务 ， 为 不 同 容量 下 集合 吸引 力 和 平均 
吸引 力 的 关系 提供 更 直观 的 证 据 。 
5.1 方法 

(1) 被 试 

采用 GPower 以 统计 功效 power=0.8， 中 等 效应 量 f=0.25 和 单 因素 5 水 平 ( 评 
分 类 型 : 不 包含 平均 面孔 的 集合 的 成 员 均 值 ML1、 不 包含 物理 平均 面孔 集合 但 将 
平均 面孔 计算 在 内 的 成 员 均值 M2、 不 包含 平均 面孔 的 集合 G1、 包含 平均 面孔 的 
集合 G2、 平 均 面孔 Avg) 为 参数 估计 的 最 小 样本 量 为 N=21。 实 际 招募 中 国人 民 
大 学 在 校生 31 名 大 学 生 ， 剔 除 一 名 评分 全 距 小 于 10 的 被 试 ， 有 效 被 试 30 名 (15 
名 女性 )， 平 均 年 龄 21.39 岁 ， 标 准 差 2.46， 右 利 手 ， 视 力 或 矫正 视力 正常 。 

(2) 实验 材料 

实验 刺激 与 实验 1 实验 2 相同 。 

集合 刺激 包含 4 张 图 片 , 集合 刺激 以 2x2 矩阵 呈现 。 当 评价 类 型 为 集合 平均 
面孔 ， 刺 激 呈 现在 屏幕 中 央 ， 单 张 面孔 图 片 的 视角 为 5.69”X6.53° 

在 评分 类 型 上 ， 使 用 4 张 原始 面孔 组 成 集合 ， 即 是 “不 包含 平均 面孔 集合 ” 
水 平 ; 如 果 使 用 3 张 原始 面孔 组 成 集合 ， 并 将 集合 成 员 的 平均 面孔 作为 新 成 员 进 
入 集合 中 ， 即 是 “包含 平均 面孔 集合 ”水 平 ,将 集合 成 员 面 筷 和 平均 面孔 再 次 进行 
单独 评定 ， 即 为 “单独 评定 ”水 平 。 

(3) 实验 设计 与 程序 

与 实验 3 相同 。 
5.2 结 


与 实验 3 类 似 , 使 用 单 张 面孔 的 评分 来 计算 集合 的 吸引 力 平均 值 , 计算 不 包 
含 平均 面孔 集合 条 件 下 的 集合 成 员 评 分 均值 ， 得 到 M1 = 47.87; 再 假设 该 集合 生 
成 了 平均 面孔 从 而 计算 包含 了 平均 面孔 的 成 员 均 值 ， 得 到 M2 = 50.32。 将 MI. 
M2、 不 包含 平均 面孔 条 件 的 集合 吸引 力 G1、 包 含 平 均 面 孔 条 件 的 集合 吸引 力 
G2 和 平均 面孔 吸引 力 Avg 作为 评分 类 型 5 个 水 平 进行 方差 分 析 。 结 果 表 明 〈 如 
图 6)， 评 分 类 型 主 效应 显著 ，F (4，116) = 6.27，p < 0.001，H2 = 0.18。 多 重 比 
较 结果 如 下 : 

首先 ，M2 显著 大 于 MI, p < 0.001，95%CI = [1.82，3.08]， 再 次 确认 了 合成 
平均 面孔 对 集合 吸引 力 平均 值 的 提升 作用 。 其 次 , 不 包含 平均 面孔 的 集合 吸引 力 
评分 G1 与 包含 平均 的 集合 G2 差异 不 显著 ，p = 0.110; 5 M 差异 不 显著 , p= 
0.977, 5 MI 的 差异 也 不 显著 ，p = 0.504。 第 三 , 平均 面孔 吸引 力 显 著 高 于 整个 
集合 的 吸引 力 Gl. G2 和 成 员 平 均值 MI. M2, ps 和 0.007。 此 外 ， 趋 势 分 析 
表明 ， 从 集合 成 员 平 均值 、 集 合 吸 引力 到 平均 面孔 ， 存 在 着 逐渐 增加 的 趋势 ，F 
(1, 29) =21.05, p «0.001, np’ =0.42. 

除 此 以 外 , 集合 平均 面孔 和 集合 整体 吸引 力 的 差 值 , 不 包含 平均 面孔 集合 条 
件 大 于 包含 平均 面孔 集合 的 条 件 (9.90 vs. 3.64), 1(29) = 6.40, p < 0.001, 95%CI= 
[4.26, 8.26], Cohen'sd = 2.38， 可 以 更 直观 地 印证 实验 2 的 包含 平均 面孔 条 件 下 
中 “被 试 判断 探测 刺激 吸引 力 更 高 的 比例 降低 了 ”这 一 结果 。 

对 实验 4 和 实验 3 中 的 平均 面孔 吸引 力 进 行 比较 , 结果 表明 小 集合 面孔 形成 
的 平均 面孔 吸引 力 更 低 , 60.11 vs. 65.24, p = 0.004, 95%CI = [2.76, 13.85], Cohen's 
d= 0.94。 对 实验 4 和 实验 3 中 平均 面孔 和 和 集合 平均 值 的 差 值 (6.76 vs. 12.55) 进 行 
跨 实验 比较 , 发 现存 在 一 种 可 能 的 趋势 ， 即 实验 4 的 小 集合 中 平均 面孔 和 集合 成 
员 平 均值 的 差异 更 小 ,校正 1(35.649) = 1.72, p = 0.094，95%CI = [-1.06, 12.81], 
Cohen's d = 0.07. 


5.3 讨论 

实验 4 的 评分 任务 结果 为 实验 2 的 结果 提供 了 直接 的 文 持 。 首 先 , 在 小 容量 
集合 中 , 集合 吸引 力 高 评 现象 减弱 了 , 集合 吸引 力 和 集合 成 员 评 分 平均 值 M1,M2 
都 没有 显著 差异 ,结合 实验 3 结果 ,验证 了 前 人 结论 : 集合 吸引 力 高 评 现象 在 大 
容量 集合 强 ， 在 小 容量 集合 弱 。 这 符合 平均 面孔 在 小 集合 中 更 易 受 干扰 的 假设 。 


此 外 ， 小 容量 集合 的 平均 面孔 吸引 力 确 实 下 降 ， 和 集合 平均 值 的 差异 更 小 ， 因 而 
小 集合 平均 面孔 吸引 力 相 对 大 集合 而 言 较 低 也 是 高 评 现象 减少 的 一 个 可 能 原因 。 

其 次 ,实验 4 中 ， 类似 于 实验 3 的 结果 ， 集 合 是 否 包含 平均 面孔 对 于 集合 评 
分 没有 显著 影响 (支持 假设 2， 不 支持 假设 1); 并 且 不 包含 平均 刺激 的 集合 评分 
G1 也 和 平均 面孔 计算 在 内 的 集合 成 员 平 均值 M2 没有 差异 。 趋 势 分 析 和 多 重 比 
较 结果 表明 , 不 包含 平均 刺激 的 集合 评分 更 接近 于 包含 平均 面孔 条 件 的 结果 。 这 
些 结果 说 明 小 容量 集合 也 可 能 受到 了 生成 的 平均 面孔 的 影响 。 此 外 , 集合 吸引 力 
和 平均 面孔 吸引 力 的 差异 在 不 包含 平均 面孔 刺激 的 集合 条 件 下 更 大 (假设 3), 
这 反映 了 包含 平均 面孔 刺激 的 集合 吸引 力 更 接近 平均 面孔 吸引 力 , 更 直观 地 说 明 
了 在 较 小 容量 的 集合 中 ， 被 试 主观 形成 的 平均 面孔 表征 被 抑制 (结合 实验 2 结 
果 )， 也 说 明了 为 何在 实验 2 的 包含 平均 面孔 条 件 下 中 ， 被 试 判断 探测 刺激 吸引 
力 更 高 的 比例 降低 了 。 
6 综合 讨论 

实验 1、2 的 按键 反应 和 扩散 模型 拟 合 结果 和 实验 3、4 的 评分 结果 共同 说 明 ， 
当 集合 容量 为 12 张 ， 高 吸引 力 的 平均 面孔 是 否 出 现 不 影响 集合 吸引 力 评分 和 平 
均 辨 别 任务 ， 说 明 表 征集 合 时 形成 了 集合 平均 面孔 ; 当 集合 容量 为 4 张 ， 平 均 面 
孔 效 应 减弱 了 , 可 能 是 由 于 集合 平均 面孔 的 吸引 力 较 低 以 及 平均 面孔 被 个 体 表 征 
FHT « 
6.1 集合 面孔 吸引 力 高 评 现象 

在 Van Osch 等 人 (2015) 的 研究 中 ， 通 过 采用 给 若干 名 女性 拍摄 的 自然 材料 
(如 聚会 照片 ) 评 分 来 探究 集合 吸引 力 ， 则 发 现 了 在 较 大 的 集合 (人 数 较 多 的 照片 ) 
中 存在 集合 吸引 力 高 于 集合 成 员 吸引 力 平均 值 的 情况 。 

实验 1 的 平均 辨别 任务 发 现 ， 当 集合 不 包含 平均 面孔 时 , 判断 探测 刺激 吸引 
力 更 高 的 比例 与 包含 平均 面孔 时 相似 , 说 明 两 种 条 件 的 平均 吸引 力 相 近 , PaE 
平均 面孔 的 集合 吸引 力 高 于 成 员 面孔 的 平均 值 , 从 另 一 个 角度 反映 了 集合 吸引 力 
高 评 现象 。 实 验 3 则 直接 再 次 验证 了 大 容量 集合 的 集合 吸引 力 高 评 现象 。 

实验 4 的 评分 结果 说 明 集 合 吸引 力 高 评 现象 较 弱 。 而 实验 2 正确 率 分 析 表 明 ， 
实验 2 也 出 现 了 集合 吸引 力 高 评 现象 ， 只 是 实验 1 更 明显 。 类 似 地 ,在 Van Osch 
等 人 (2015) 的 研究 中 ， 较 小 的 集合 也 很 少 观察 到 集合 吸引 力 高 于 成 员 吸 引力 平均 


值 。 在 本 研究 中 ， 既 有 直接 通过 评分 获得 集合 面孔 吸引 力 高 评 现象 的 直接 证 气 ， 
也 有 借助 平均 面孔 在 集合 中 的 作用 大 小 来 推测 的 部 分 。Van Osch 5$ A (2015) 9E2E 
中 使 用 的 是 生态 效 度 较 高 的 自然 材料 , 存在 成 员 吸引 力 分 布 集中 , 缺少 具有 代表 
性 的 高 低 吸 引力 面孔 的 问题 。 本 研究 则 改 用 了 没有 背景 ， 由 单独 评分 的 面孔 素材 
组 成 的 集合 ， 并 平衡 不 同 吸引 力 水 平 的 面孔 数量 ， 依 旧 得 到 了 类 似 的 结论 ， 说 明 
在 大 容量 集合 中 集合 吸引 力 高 评 现象 是 比较 稳定 的 , 且 现 象 的 产生 与 集合 平均 面 
孔 的 形成 有 关 。 
6.2 平均 表征 的 形成 机 制 

通过 将 平均 辨别 的 实际 反应 与 不 同 理论 假设 的 反应 分 布 进行 比较 和 拟 合 , 我 
们 发 现 集合 吸引 力 包含 平均 面孔 贡献 的 假设 拟 合 更 好 , 支持 了 平均 表征 过 程 中 形 
成 了 平均 刺激 (如 平均 面孔 )。 在 实验 1 中 ， 集 合 包 含 平 均 面 孔 时 ， 判 断 平 均 面 孔 
吸引 力 更 高 的 比例 并 未 降低 , 说 明 包 含 或 不 包含 平均 面孔 刺激 的 集合 吸引 力 同 等 
接近 平均 面孔 , 因此 平均 表征 并 不 是 通过 集合 成 员 的 平均 值 计 算得 到 的 。 类 似 的 ， 
无 论 还 是 实验 3 还 是 实验 4， 都 发 现 平 均 表 征 的 吸引 力 要 远 高 于 集合 成 员 的 平均 
值 。 在 实验 2 的 小 集合 中 , 发现 新 面孔 作为 探测 刺激 与 平均 面孔 作为 探测 刺激 的 
结果 不 同 , 则 说 明 平 均 面孔 作为 探测 刺激 出 现 之 前 已 经 得 到 了 加 工 。 这 个 结论 和 
近期 Ying FA (2020) 的 结论 一 致 ， 他 们 通过 吸引 力 适 应 后 效 范式 发 现 ， 由 一 
组 面孔 引发 的 适应 后 效 等 于 这 一 组 的 平均 面孔 引发 的 适应 后 效 , 同样 支持 了 集合 
表征 中 存在 平均 刺激 的 形成 。 

值得 注意 的 是 , 平均 刺激 的 形成 也 需要 资源 投入 , 体现 在 实验 1 没有 平均 面 
孔 输入 时 需要 更 长 的 编码 加 工时 间 。Huang(2015) 发 现 对 于 对 象 特征 和 统计 表征 ， 
启动 的 效果 是 相等 的 , 说 明 统计 表征 的 形成 至 少 需要 和 单个 个 体 加 工 同等 的 注意 
资源 。 因 此 ， 平 均 表 征 和 个 体 表 征 在 早期 可 能 是 因此 相互 竞争 的 关系 (Li et al, 
2016)。 由 于 早期 没有 足够 的 认 知 资源 加 工 所 有 个 体 ， 因 此 优先 形成 了 平均 表征 。 
Bauer (2017) 以 不 同 长 短 的 线条 作为 集合 刺激 ， 在 平均 辨别 任务 前 加 入 数字 记忆 
任务 的 研究 发 现 ， 相 比 低 记 忆 负 荷 条 件 (1 个 0)， 高 记忆 负荷 条 件 下 (4~7 个 随机 
数字 ) 更 有 利于 形成 平均 表征 。 实 验 1 和 实验 2 的 跨 实验 比较 也 发 现 ， 在 小 集合 
中 整体 信息 积累 速度 也 比 大 集合 更 慢 。 

与 此 同时 ， 小 集合 同样 形成 了 平均 表征 且 需 要 资源 的 投入 ， 表 现在 实验 2 


没有 平均 面孔 输入 时 信息 积累 较 慢 。 也 就 是 说 无 论 大 小 集合 , 都 有 平均 刺激 的 形 
成 。 而 大 小 集合 之 间 的 反应 差异 ， 是 由 于 其 他 原因 造成 的 ， 而 不 是 出 于 不 同 的 加 
工 机 制 。 

6.3 集合 吸引 力 与 平均 面孔 的 关系 

尽管 集合 吸引 力 表征 中 包含 了 平均 面孔 的 贡献 , 但 集合 吸引 力 并 不 完全 等 同 
于 平均 面孔 的 吸引 力 。 无 论 实验 1 还 是 实验 2， 均 发 现 被 试 倾向 于 评价 平均 面孔 
比 集合 吸引 力 更 高 的 结果 。 并 且 实 验 3、4 平均 面孔 的 评分 也 要 高 于 集合 的 评分 ， 
说 明 集 合 吸引 力 是 基于 平均 面孔 的 形成 ， 将 平均 刺激 纳入 进来 成 为 集合 的 成 员 ， 
再 对 于 集合 进行 整体 评价 。 因 此 ， 集 合 吸引 力 高 评 现象 并 不 完全 如 Van Osch 等 
人 (015) 所 推断 的 仅 依赖 于 平均 面孔 ， 而 是 与 表情 集合 加 工 类 似 ， 读 取 平 均 面 孔 
的 表征 (Haberman & Whitney, 2009). 

类 似 的 现象 是 ， 被 试 经 常 在 再 认 任 务 中 把 平均 表征 误 以 为 是 集合 中 的 成 员 ， 
或 者 认为 平均 面孔 与 其 中 一 个 成 员 具 有 相同 的 号 份 (Neumann etal., 2013). ¥ Wr 
过 程 中 被 试 可 能 使 用 了 一 种 策略 : 在 加 工整 个 集合 吸引 力 的 时 候 , 将 平均 面孔 知 
觉 成 集合 中 某 一 成 员 ， 由 于 观察 到 集合 中 的 其 他 面孔 的 吸引 力 多 数 低 于 平均 面 
孔 ， 进 而 倾 癌 于 认为 单独 出 现 的 平均 面孔 的 吸引 力 较 高 。 

研究 者 曾 发 现 ， 当 存在 多 张 面孔 , 单 张 面孔 的 吸引 力 会 被 判断 得 比 孤 立 出 现 
时 更 高 (Walker & Vul，2014)， 并 同样 解释 为 平均 的 作用 。 背 景 面孔 导致 会 将 人 
脸 的 感知 偏向 群体 的 平均 水 平 。 因此 , 伴随 同一 目标 面孔 出 现 的 背景 面孔 吸引 力 
越 高 ， 目 标 面 孔 就 会 被 评价 得 越 高 (DeBruine etal., 2007; Perrett et al., 1994; 
Walker & Vul, 2014)。 因 此 , 平均 面孔 产生 可 能 会 对 集合 中 的 其 他 成 员 产 生 影响 ， 
由 于 平均 面孔 的 吸引 力 高 ,导致 集合 其 他 成 员 的 吸引 力也 得 到 了 抬升 。 这 是 平均 
面孔 对 其 他 面孔 产生 的 影响 ， 也 可 能 是 集合 吸引 力 高 评 现象 产生 的 路 径 之 一 。 
6.4 平均 刺激 表征 与 集合 容量 的 关系 

小 容量 集合 中 面孔 吸引 力 一 般 会 被 评价 与 集合 成 员 平均 值 相 同 (Anderson， 
1965; Anderson et al.，1973)， 且 集合 吸引 力 高 评 现象 在 小 容量 集合 消失 (Van Osch 
et al.，2015)， 说 明 小 容量 的 平均 表征 存在 一 些 特异 性 。 

一 方面 , 小 容量 集合 产生 的 平均 面孔 刺激 的 吸引 力 相对 较 低 , 可 能 因此 导致 
对 于 集合 吸引 力 的 增加 效果 较 小 ， 因 此 集合 吸引 力 高 评 现象 减少 。 另 一 方面 ， 可 


能 是 平均 表征 收 到 了 干扰 。 道 层级 理论 提出 (Hochstein et al.，2015)， 高 级 皮层 的 
整体 表征 以 自 上 而 下 的 方式 返回 到 局 部 加 工 ， 以 局 部 细节 信息 证 实 (或 矫正 ) 初 步 
的 整体 表征 估计 值 ， 也 就 是 说 平均 表征 在 加 工 后 期 会 受到 个 体 表征 的 矫正 。Li et 
al(2016) 也 发 现 ， 当 呈现 时 间 延 长 ， 认 知 资源 增加 ， 会 导致 个 体 表征 的 精度 增强 。 

这 两 种 理论 均 得 到 了 本 研究 结果 的 文 持 ， 在 实验 2 中 判断 平均 面孔 吸引 力 更 
高 的 比例 更 低 ， 以 及 实验 4 中 的 平均 面孔 和 集合 吸引 力 差 值 比 较 结果 表明 小 集合 
包含 平均 面孔 的 集合 吸引 力 和 平均 面孔 的 差异 更 小 , 都 说 明 小 集合 平均 面孔 吸引 
力 较 低 在 其 中 存在 影响 。 与 此 同时 ， 实 验 2 在 包含 平均 面孔 刺激 时 平均 面孔 吸引 
力 更 高 的 比例 更 低 , 说 明 相 对 于 被 试 自己 生成 平均 面孔 刺激 ,直接 输入 平均 面孔 
减少 了 集合 吸引 力 和 平均 面孔 之 间 的 差异 ， 支 持 小 集合 的 平均 面孔 受到 了 干扰 。 
在 小 集合 中 无 论 集 合 是否 包 含 平均 面孔 , 信息 积累 速度 都 比 大 集合 更 慢 ,， 也 支持 
递 层级 理论 所 说 的 局 部 细节 信息 对 于 整体 表征 的 矫正 和 干扰 。 
7 结论 

(1) 面 孔 集合 吸引 力 高 评 现 象 是 基于 平均 面孔 刺激 的 形成 。 

(2) 平 均 表 征 的 产生 是 基于 平均 刺激 的 产生 。 

(3) 无 论 在 大 小 集合 中 都 形成 了 平均 刺激 。 小 集合 中 集合 吸引 力 不 出 现 高 评 
现象 是 由 于 平均 刺激 受到 了 干扰 ， 并 且 平 均 刺 激 本 身 吸 引力 较 低 。 

(4) 平 均 表 征 的 加 工 也 需要 一 定 认 知 资源 。 
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